시간 지연 신 경 망 을 이용한 음악 장르 분류 
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요 약 


본 논 문 에서는 오디오 데 이 터 의 효과적인 검 색 을 위하여, 시간 지연 신 경 망 올 이용한 음악 장르 분류 시스템 
을 제 안 한 다. 분류 대상 장 르 는 21466, 00400, 800 006, 2470 ㅁ 8 ㅁ 00<, 1322, ㅁ &8(5041), 60000, 17890 
4681 의 8 종 류 이 다. 장 르 를 분 류 하 기 위한 비 교 단 위 는 곡 중 에 서 의 한 마 디 이 다. 이러한 마 디 는 리 듬 의 특 성 울 
효과적으로 반 영 하는 스네어 드럼 소 리 롤 기 준 으로 추 출 한 다. 분 류 기는 시간 지연 신 경 망 을 이 용 하 여 구 성 하 
며 입 력 은 추 출 된 마 디 에 대한 주파수 특 징 벡 터 이다. 제안한 시 스 템 의 유 효 성 을 검 중 하 기 위한 실 험 에서, 
장르별 10 곡 씩 총 80 곡 의 학습 데 이 터 와 장르별 5 곡 씩 총 40 곡 의 테스트 데 이 터 에 대하여 각각 92.5% 와 
608 의 정 인 식 율 을 보였다. 
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1 서 론 


최근 컴퓨팅 환 경 의 발 달 과 인 터 넷 의 보 편 화 로 인 
하여 다양한 웅 용 분 야 에서 멀티미디어 데 이 터 의 사 
용이 급 중 하 고 있다. 따라서 멀티미디어 데 이 터 에 대 
한 사 용 자 들의 검색 요 구 도 중 가 하고 있으며, 이를 
위한 검색 시 스 템 에 대한 연 구 가 활발히 진 행 되고 
있다. 그러나 이 미 지 나 동영상 데 이 터 에 대해서는 다 
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양한 검색 방 법 론 이 제 시 되고 있으나, 오디오 데이터 
에 대한 연 구 는 드물다. 

인 터 넷 상 에서 오디오 데이터 서 비 스 를 제 공 하는 
업 체 들은 수 작 업 에 의 존 하고 있다. 즉 전 문 가 가 모든 
곡 들 에 대해 해당 장르, 분위기, 빠 르 기 등 의 다양한 
정 보 를 수 작 업 으로 추 출 하고, 이를 데 이 터 베 이 스 에 
저 장 하여 사용자 질 의 에 사 용 한 다. 이러한 검 색 시스 
템 은 새로운 곡 들 을 추 가 할 때 마 다 수 작 업 으로 곡 에 
대한 정 보 를 추 출 해 야 하므로 많은 정보화 비 용 이 요 
구 된 다. 

내용 기 반 의 선 행 연 구 들은 대부분 사 용 자 가 곡 의 
제 목 을 알지 못할 때, 제목 대신 다른 방 법 으로 곡 을 
검 색 할 수 있게 하는 방 법 에 대한 연 구 이 다. 주로 허 


망 이나 사 용 자 가 알 고 있 는 계 명 을 질 의 어 로 사 용 하 
여 오디오 데 이 터 베 이 스 에 저장된 곡 을 검 색 한 다 
[1-3]. 이러한 방 법 에서는 사 전 에 모든 곡 들 에 대해 
허 밍 이나 계 명 들 과 같이 비교할 수 있는 특 징 들 을 
추 출 하여 데 이 터 베 이 스 를 구 축 해 야 한다. 특히, 검색 
시 곡 전 체 에 대한 특 징 이나 계 명 을 추 출 하 여 비교할 
수 없으므로 사 용 자 가 많이 사용할 것으로 예 상 되는 
부 분 을 추 출 해 서 저 장 해 야 한 다. 그러나 오디오 데이 
터 의 방 대 함 과 모 호 함 으로 인하여 효과적인 특징 추 
출 이 어렵고 또한 특징 비교 방 법 을 개 발 하기 힘들 
다. 따라서 효율적인 오디오 검색 시 스 템 올 개 발 하기 
위해서는 오디오 매칭 알 고 리 즘 과 무 엇 보 다도 오디 
오 데 이 터 로부터 관심 있는 영 역 의 추출 방 법 에 관한 
연 구 가 선 행 되어야 한다. 

본 논 문 에서는 시간 지연 신 경 망 (110 찌 ) 을 이용 
한 음악 장르 분류 시 스 템 을 제 안 한 다. 오디오 데이 
터 의 영역 추출 방 법 론 으로 곡 중 에 서 의 마디 추출 
방 법 과 오디오 데이터 비교 방 법 으 로 는 추 출 된 마디 
를 이용한 11844 분 류 기 를 제 시 한 다. 이러한 방 법 들 
을 적 용 하여 오디오 데 이 터 를 효 율 적 으로 처리 및 
관 리 할 수 있는 음악 장르 분류 시 스 템 을 제 안 한 다. 

음 악 은 멜 로 디 와 리 듬 으로 양 분 할 수 있다. 연주 
시 악 기 들 은 마 디 에 근 거 하여 리 듬 을 표 현 한 다. 리듬 
은 규 칙 성 을 가지게 되며 드 럼 이나 베 이 스 들이 주로 
사 용 되 는 리 듬 악 기 이다. 따라서 오디오 데 이 터 에 서 
관 심 있는 영 역 의 기본 단 위 인 마 디 를, 음 악 의 리듬 
규 칙 성에 근 거 하여 추출 할 수 있다. 본 논 문 에서는 
드럼 중에서도 가장 주 기 적 이 며 음 색 이 뚜 렸 한 스 네 
어 드럼 소 리 를 기 준 으 로 마 디 를 추 출 한 다 . 

분 류 기로 사 용 하 는 11)2 찌 씨 은 다 충 신 경 망 에 동적 
요 소 인 시간 지연 요 소 롤 첨 가 하 여 학 습 패 턴 의 동적 

위 치 에 무 관 하게 가 미 하 도록 구성된 신경 
망 이다. 학 습 시 간 은 길지만 실행 시 처 리 속 도 가 빠르 
다는 특 성 을 가지고 있기 때문에 오디오 데 이 터 와 
같이 데이터 양 이 방 대 하고 많은 처 리 가 요 구 되는 
검 색 기 법 에 효 과 적 이다. 


2. 음악 장르 분석 및 분류 대상 장르 
현재 세 상 에 는 매우 많고 다양한 종 류 의 음악 장 


르 가 존 재 한다. 그리고 지금도 새로운 장 르 가 지속적 
으로 만 들 어 지고 있으며, 또 어떤 장 르 는 다른 ' 장 르 
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로 대 체 되어 소 멸 되기도 한다. 일 반 적 으로 음악 장르 
는 어떤 음악 스 타 일 이 유 행 하 면서 만 들 어 지고, 그 
스 타 일 이 고 정 화 되면서 한 음악 장 르 로 자리 잡는다. 
일 부 는 고 정 화 되지 못하고 소 멸 되기도 한다. 그리고 
이러한 음악 스 타 일 이란 음 악 적 인 면 만 을 일 컨 는 것 
은 아니다. 문화적 상 황 에 의해 노래 가 사 가 담고 있 
는 내 용 이나, 뮤 지 션 들 의 행위 등, 다양한 요 소 를 포 
함 하 는 의 미 이다. 이처럼 음악 장 르 는 다양한 요 인 들 
에 의해 만들어진다. 즉 뮤 지 션 들 의 새로운 시 도 에 
의해 만 들 어 지기도 하고, 상업적인 목 적 에 의해 만들 
어 지 기도 한다. 이러한 음악 장 르 들은 최근 두 장르 
이상의 요 소 를 포 함 하여 크 로 스 오 버 (0 ㅠ 088-061) 라 
는 새로운 장 르 가 만 들 어 지거나, 또 어떤 뮤 지 션 들의 
앨 범 은 두 가지 이상의 음악 장 르 에 포 함 되기도 하는 
것처럼 매우 복 잡 하다. 이처럼 현재 알려져 있는 음 
악 장 르 들 은 특정한 기 준 에 의해 만들어진 것이 아니 
기 때문에, 어떤 특정한 기 준 을 통해 분 류 하기 힘들다. 

본 논 문 에서는 이러한 대 중 음악 특 성 을 고 려 하 여 
음악 장르 중에서 일 반 화 되어 고 정 화 된 음악 장 르 를 
선 별 하 고, 이들 장르 중 내용, 즉 가 사 가 담고 있는 
의 미 나 어떤 문 화 적 인 요 인 에 의해 만 들 어 지 지 않은, 
순수한 음악적 특 성 을 가진 음악 장 르 들을 분 류 하고 
자 하는 대상 음악 장 르 로 선 택 하였다. 즉 특정한 리 
듬 이나 음 악 적 인 스 타 일 이 정해져 있고, 악기 구성 
또한 거의 일정한 음악 장 르 를 선 택 하였다. 이러한 
규 칙 에 의해 선택된 음악 장 르 는 21468, (0400, 
트 200 0076, 2000 모 00<, ]422, 8&8(50 미 ), 16@ 아 00, 
17858 라 리 의 8 개 음악 장 르 이 다. 실 험 에 사용할 
데 이 터 들은 각 음악 장 르 에 대해 수 집 한 인터넷 자료 
와 관련 참 고 도 서 에 서 공 통 적 으로 가장 해당 장 르 를 
잘 표 현 하 며 충 실 하다고 평 가 되는 뮤 지 션 들의 앨범 
들 에서 선 별 하 여 구 성 하 였 다 [45]. 


3. 음악 장르 분류 시스템 


본 논 문 에서 제 시 하 는 분류 시 스 템 의 전체 구 성 은 
그림 1 과 같다. 전처리 단 계 에 서는 스테레오 사운드 
를 모 노 로 변 환 한다. 마디 시작점 찾기 단 계 에서는 
스네어 드 럼 의 특 성 을 이 용 하 여 마디 시작 위 치 와 
길 이 를 구한다. 마디 추출 단 계 에 서는 특징 추 출 을 
위한 한 마 디 를 추 출 한 다. 데이터 정규화 단 계 에 서는 
다 운 샘 플 링 을 통하여 추 출 된 데 이 터 의 크 기 를 정규 


416 멀 티 미 디 어 화 회 논문지 제 4 권 제 5 초 (2001. 10) 


마디 시작점 찾기 


데이터 정규화 


70 삐 분 류 기 구성 


그림 1. 분류 시 스 템 의 구성 단계 


화 한 다. 7 단 계 에서는 추 출 된 마 디 에서 1『 ㅠ 를 
통하여 특 징 을 추 출 하고, 이를 학 습 패 턴 으로 구성한 
다. 마 지 막 으 로 71040 분 류 기 구성 단 계 에서는 구성 
된 학 습 패 턴 으로 학 습 하여 음악 장르 분류 시 스 템 을 
구 성 한 다. 


3.1 전처리 


(00 음 질 의 웨이브 파 일 은 일 반 적 으 로 44.1 112, 
16 로 샘플링 된다. 그리고 일 반 적 으로 4 분 정 도 의 
웨이브 파 일 의 크 기 는 약 40486 정 도 이며, 스 테 레 
오로 녹 음 되 어 있으므로 2 개 의 출력 채 널 을 가진다. 
전처리 단 계 에서는 이와 같이 방대한 데 이 터 의 연산 

수 를 줄이기 위해 스테레오 사 운 드 를 모 노 로 변환 
한다. 


3.2 마디 시작점 찾기 및 마디 추출 


일 반 적 으로 모든 음 악 은 박 자 와 빠 르 기 라는 요소 
를 가진다. 그리고 곡 마다 이러한 박 자 와 빠 르 기 는 
다르기 때문에 모든 곡 에 대해 같은 위 치 에서 같은 
크 기 를 가 져 오는 것은 의 미 가 없다. 따라서 본 논문 
에서는 마 디 의 시 작 점 들을 찾고, 특징 추 출 에 사 용 하 
기 위한 크 기 로 곡 중에서 한 마 디 의 크 기 를 추출한 
다. 설 험 에서 다룬 대 부 분 의 데 이 터 들을 분석해 본 
결과, 대 부 분 의 곡 들 이 444 박자 또는 6/8 박 자 이며, 
빠 르 기 도 일 정 하다. 그리고 대 부 분 의 곡 들 은 멜로디 
를 담 당 하는 부 분 과 리 듬 을 담 당 하는 부 분 으로 구성 


되어 있다. 그리고 멜 로 디 를 구 성 하 는 부 분 보다 리듬 


을 구 성 하 는 부 분 에 서 규 칙 성 을 가진다. 본 연 구 에 서 
는 마 디 를 찾기 위해 이러한 리듬 부 분 의 특 성 에 의 
해 마 디 의 시 작 점 을 찾는다. 

리 듬 은 대부분 드 럼 과 베이스 기 타 라 는 악기 또는 
이와 유사한 기 능 을 하는 악 기 를 사 용 하 여 연 주 되 는 
특 성 올 가지고 있다. 예 를 들면, 째 즈 에 서는 베이스 
키타 대신 이와 유사한 더블 베 이 스 를 사 용 하던지, 
드럼 대 신 에 여러 다른 타 악 기 를 사 용 한 다. 그러나 
이러한 다른 악 기 로 연 주 된 곡 이라 할 지 라 도 대부분 
비슷한 음 역 을 표 현 한 다. 본 논 문 에 서 마 디 의 시작점 
을 찾기 위해 드 럼 파 트 를 구 성 하고 있는 스네어 드럼 
이라는 악 기 에 초 점 을 맞 추 었다. 이 악 기 는 대부분 
곡 의 리 듬 에 서 2 번 째 와 4 번 째 박 자 에 규 칙 적 으로 나 
타 나 며 , 표 현 되 는 주 파 수 가 거의 일 정 하다는 특 성 을 
가진다. 

일 반 적 으로 곡 들 은 뮤 지 션 들이 의 도 한 곡 의 분위 
기를 만들기 위하여 도 입 부 분 을 가지고 있다. 이러한 
도 입 부 분 들 은 대부분 특별한 음 악 장 르 의 특 성 을 갖 
지 않는다. 그리고 곡 에 따라 템 포 도 자유로운 경우 
가 많기 때문에 도 입 부 분 을 제 거 해 야 한다: 본 논문 
의 실 험 에 사 용 된 데 이 터 들을 조사해 본 결과 곡 들 의 
도 입 부 분 의 크 기 가 40 초 미 만 이었다. 따라서 이러한 
도 입 부 분 을 제 거 하기 위해 웨이브 파 일 의 앞부분 40 
초가 지난 다 음 부터 곡 들 의 마디 시 작 점 을 찾는다. 


마 디 의 시 작 점 을 찾기 위해 일반적인 마 디 의 크 기 가 


.220.000 개 의 샘플링 이 하 라 는 특 징 을 고 려 하 여 40 초 


가 지난 다 음 부 터 262.144 개 의 샘 플 을 채 취 한 다. 그 


ㆍ 림 3 는 데 이 터 : 추 출 의 예 를 보여준다. 


그리고, 스네어 악 기 의 소 리 를 찾기 위해, 시 간 축 
상 에 서 의 신 호 롤 주파수 영 역 에 서 의 신 호 로 변 환 하 
여 음성 분 석 이나 음향 분 석 에 널리 사 용 되 는 방 법 인 
1 ㅠ [를 사 용 한 다. 본 논 문 에서는 2566- ㅁ 0011 를 
1,024 번 수 행 하 였으며, 푸리에 변 환 은 대 칭 성 을 가지 
므로 1 번 째 에서 128 번 째 까 지 의 주 파 수 대 역 만 사용 


그림 2. 마디 추 출 을 위한 데이터 추 출 의 예 


하였다. 따라서 변 환 된 데 이 터 는 1024×128 의 크기 
를 가지며, 1024 는 시 간 을 나타내고, 128 은 주파수대 
역 폭 을 나타낸다. 

변 환 된 데 이 터 를 분석해 본 결과, 모든 데 이 터 에 
서 스네어 악 기 의 소 리 는 37 번 째 주파수 대 역 에 서 부 
터 43 번 째 주파수 대역 사 이 에 서 잘 나타나는 사 실 을 
알 수 있었다. 그림 3 은 실험 데 이 터 에 서 37 번 째 주파 
수 의 예 이 며 , 가장 높은 두 개의 정 점 이 한 마 디 를 
간 격 으로 한 스네어 드럼 부 분 이다. 

[를 사 용 하여 변 환 된 값 들 에 대해 아 래 의 순서 
(9660 1~8660 7) 에 의해 마 디 의 시 작 점 과 크 기 를 구 
한다. 


9660 7: 스네어 악 기 의 소리 후 보 를 찾기 위해 
1024 의 시 간 을 32 씩 의 32 개 의 구 간 으로 나누어, 37 번 
째 에서 43 번 째 까지 각 주파수 대역 별로 각 구간 최 
대 값 을 찾는다. 그림 4 는 각 구 간 에 서 의 최 대 값 을 찾 
은 결 과 이 다. 


이 인 ; 40 번 11 변 
5236 .61613 : 더 오 36691 63671 
두 30034 16366 
26406 1763 


3 : 62742.65762 
1 : 66334 341 
: 67173. 07304 
; 바라 332 


22552.66149 
26166 66602 
73067 620 


21639 66796 

62285. 63639 1200?.?446 

12969 40663 27635 10439 904 0: 41517.00663 9009 

9372.00566 1023: 94619 65280 68361 37356 1021 _ 65952.66081 1023: 56491 6811 


그림 4. (9166 1) 의 예 
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50662 2: 위 애서 구한 구 간 별 최 대 값 을 정 렬 하여 


각 주 파 수 에서 상위 12 개 의 값 들 을 후 보 로 선 정 한 다. 
그림 5 는 [5662 2] 의 예 이 다. 


155607 . 396066.17477| 


09 

: 115732.9775 
65 . 90469.59600 터 
99120. 62441 


그림 5. (6166 2) 의 예 


5000 3: 각 주 파 수 에서 선 정 된 값들 중 시간 위치 
값 이 33 간격 보다 작은 후 보 들 을 비 교 하여 값 이 낮 
은 쪽 을 후 보 에서 삭 제 한다. 


낙 재 푸 남 폰 77 낸 째 주 마 수 후보 
205 73067 .025 
5 125 : 1655907.6801 
13510474. 301 
1039.26 이 지 나 
96064 37962 4680 
916 고 974 01 
326 
753 
936 1: 


그림 6. (6166 3) 의 예 


9460 4: 각 주 파 수 별로 남겨진 후 보 들 을 다른 주 
파 수 의 후 보 들 과 비 교 하여, 시간 위치 차 이 가 10 
이하인 위치 값 들 을 찾아서 투 표 한 후, 위치 값 들 의 
평 균 값 을 구한다. 


거저 
고 표 은 | 후 보 위 쳐 값 | 


그림 7. (5166 4) 의 예 
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56605: 투표 결 과 가 6 이상인 후 보 들 만을 추출한 
후 시간 순 서 대로 나 열 한 다. 


849, 123, 302, 665, 483 => 123, 302, 483, 665, 849 


그림 8. (6166 5) 의 예 


5660 6: 시간 순 으로 나열된 후보들 사 이 의 시간 
간 격 을 구한 후, 이들 중 가장 큰 값 과 가장 작은 값 을 
뻔 나머지 값 들 의 평 균 을 구한다. 그리고 한 마 디 의 
크 기 를 찾기 위해 시간 간 격 을 2 배 한다. 


시간 간격 : 179, 181, 182, 184 


시간 간격 평균 : 181.5 => 182 (반올림) 
한 마 디 의 크기 : 364 × 256 


그림 9. (5166 6) 의 예 


9660 7: 마디 시 작 점 은 최종 후보 값들 중 가장 
큰 값 을 선 정 하고, [960 6] 에 서 구한 시간 간격 평균 
을 2 로 나누어 뻔 값 이다. 


만약 후보 값들 중 123 의 값 이 가장 크 다 면 : 


123 - 91 = 32 
실제 샘플링 위 치 값 : 32 × 256 


그림 10. (6166 7) 의 예 


위 의 순 서 에 의해 찾 아 진 시 작 점 과 마 디 의 길 이 는 
256- ㅁ 00106 "에 의한 시간 간 격 이므로 실제 데이 
터 의 시 작 점 과 마 디 의 길 이 는 256 을 곱한 값 이다. 따 
라서 구 해 진 마디 시 작 점 과 크 기 에 256 을 곱한 후 
한 마 디 의 크 기 만 큼 의 데 이 터 를 추 출 한 다. 그림 11 은 
구 현 된 마디 찾기 프 로 그 램 이다. 


그림 11. 마디 추출 프로그램 


3.3 데이터 정규화 


획 득 된 데 이 터 들 은 그 곡 의 빠 르 기 에 따라 한 마 
디 의 크 기 가 다르기 때문에 추 출 되는 특 징 값 들 의 개 
수가 다르다는 문 제 가 발 생 한 다. 그러므로 모든 데이 
터 에 서 동일한 크 기 의 특 징 을 추 출 하기 위해 데이터 
를 정 규 화 하는 과 정 이 필 요 하 다. 본 논 문 에서는 데이 
터 를 정 규 화 하기 위해 앞에서 구한 한 마 디 의 샘플링 
길 이 를 이 용 하 여 다 운 샘 플 링 하였다. 다 운 샘 플 링 값 
은 다음 식 에 의해 계 산 한다. 


이 = 41003 16884 


( : 다 운 샘 플 링 값 』 : 추 출 된 마 디 의 길이) (1) 


위 식 에 의해 각 데 이 터 들은 16384 개 의 샘 플 을 가 
진 \316 파 일 로 변 환 된 다. 


3.4 학습 패턴 생성 


시간 지연 신 경 망 의 입 력 으로 사용될 학습 패 턴 을 
구 성 하기 위해 다 운 샘 플 링 으로 크 기 가 정규화 된 데 
이 터 에 대하여 2566- ㅁ 0011 8 ㅠ 를 64 번 수 행 한 다. 이 
를 통해 64×256 개 의 변 환 된 값 들 을 획 득 한 다. 이렇 
게 변 환 된 값들 중 주파수 대 역 으로 1 번 째 부터 128 번 
째 까지 128 개 에 대해 순 서 대로 4 개 씩 뽑 아 내어 이를 
합하여 32 개 의 값 을 추 출 하 고, 이를 64 번 반 복 하여 
64×32 패 턴 을 만든다. 추 출 된 패 턴 을 신 경 망 의 학습 
패 턴 으 로 사 용 하기 위해 이를 0 과 1 사 이의 값 으로 
정 규 화 한 다. 그림 12 는 생 성 된 학습 패 턴 의 예 이 다. 


그림 12. 추 출 된 학습 패 턴 의 예 


3.5 1044 분 류 기 구성 


112 찌 시 은 정 적 구조 신 경 망 에 동적 요 소 (08129, 106=- 
818000) 를 첨 가 하 여 음 성 과 같이 동 적 인 특 성 을 가 
진 데 이 터 에 대해 인 식 할 때 좋은 인 식 률 을 가지기 
때문에 음성 인식 분 야 에서 많이 사용되고 있다 
[6-10]1. 


전체적으로 112 씨 8 은 입 력 충 (1004 18767), 2 개 의 
은 닉 충 (10060 12761), 출 력 충 (04[0 바 13767) 의 다 충 
으로 구 성 된 다. 은 닉 충 에서는 시간 지연 요 소 를 통한 
입 력 으로 음 악 의 국 부 적 인 특 징 을 감 지 해 내고 출력 
충 에서는 전단 은 닉 충의 시 간 적 인 지 연 을 갖는 출력 
의 제 곱 을 더하여 출 력 을 한다. 이렇게 해서 최종적 
으로 은 닉 충 에서는 음 악 이 가지는 국 부 적 인 특 성 올 
감 지 함으로써 패 턴 올 시 각 적 으로 굴 곡 (0016-\810178) 
하게 되고, 출 력 충 에서는 전 단 의 시 간 적 으로 지연된 
출 력 들 을 합 함 으로써 입 력 패 턴 에 지 연 현 상이 발생 
하 여 도 같은 출 력 을 낼 수 있는 특 징 을 갖는다. 

일반적인 7108% 쩌 의 전체적인 구 조 는 그림 13, 14 
와 같 다 [6-10]. 그림 14 에 서 (3) 는 전체적인 구 조 를 
나타내고, (6) 는 11205 씨 을 옆 에서 본 모 습 을 나타낸 
다. 그리고 (6) 의 5[66 ㅁ 0 85126 는 시간 지 연 의 정 도 를 
나타내는 요 소 이 고, 67081 58126 는 다음 충의 한 노 
드로 전 달 될 때, 계 산 되는 시 간 축의 노 드 의 개 수 를 
나타낸다. 


그림 13. 각 계 층 에 대한 전체 구조 


(06) 옆 에 서 본 구조 


(8) 전체적인 구조 


그림 14. 17 ㅁ 구조 
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다 충 구조 신 경 망 에서 사 용 되 는 일반적인 학습 알 
고 리 즘 (]16370108 히 8011017) 인 역 전 파 (2": 280< 
-2\000888000) 알 고 리 즘 의 목 적 함 수 (06160 140- 
1020) 는 다 음 과 같다. 


= 스이 (<0-00” (2) 


식 (2) 에 서 는 번째 출 력 노 드 의 활 성 화 값 
(230078000 13106) 이 고, 따라서 목 적 함수 ㅅ 를 \ 에 
대해 편 미 분 하면 출 력 노 드 의 활 성 화 값 에 대한 오차 
의 편 미 분 값 을 얻게 된다. 


은 = ~ 0 (3) 
" 겨 


역 전 파 학습 알 고 리 즘 에서는 이 값 이 역 전 파 에 대 
한 시 작 점 이 된다. 그러나 1108 찌 에서 출 력 은 전 단 의 
은 닉 충 에서 지연된 출 력 값 의 제 곱 을 더한 것이다. 


0 = 기 ^ (4) 
따라서 식 (4) 를 식 (2) 의 정 의 에 대 입 하여 시간 
에 대해 편 미 분 하면 다 음 과 같다, 


= 20( 후 0 - 0 (5) 


일반적인 역 전 파 신 경 망 에 서 와 같이 오 차 의 편 미 
분 값 을 얻게 되고, 이 값 이 11028 씨 에 서 의 역 전 파 학 
습 의 시 작 점 이 된다. 

오류 역 전 파 시 연 결 강 도 (\6101[) 를 변 화 시키는 
데 있어서는 시 간 의 위 치 에 무 관 하게 입 력 의 특 성 들 
을 추 출 하기 위하여 시간 지연된 연 결 강 도 들 의 변화 
값 의 평 균 만 큼 을 변 화 시 킨 다음 각 연 결 강 도 에 복사 
하게 된다. 그런데 7105 씨 은 연 결 강 도 와 출 력 노 드가 
매우 많기 때문에 학습 시 매우 많은 시 간 이 소 요 된 
다. 따라서 학습 시 간 을 단 축 하기 위해서 여러 고속 
화 알 고 리 즘 을 사 용 하게 되는데, 본 논 문 에서 학 습 시 
오 류 를 급격히 줄이고 진 동 (060118000) 을 방 지 하기 
위해 학 습 률 (16870108 73[6) 과 모 멤 (27070600410) 을 
오 류 의 변화 정 도 에 따라 변 화 시키기 위해 사 용 하 
였다. 

제안한 음악 장르 분 류 시 스 템 에 서 사용한 117 씨 띠 
구 조 는 1 개 의 입 력 충 , 2 개 의 은 닉 충 , 그리고 1 개 의 
출 력 충 으로 일반적인 1108 찌 구 조 와 동 일 하게 이루 
어져 있으며, 실제 사용한 각 충의 노드 구 성 은, 입력 
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충 은 64×32 개 의 노 드 로 , 은 닉 충 은 각각 31×16, 10 
×8 개 의 노 드 로 구 성 하였으며, 마 지 막 으로 출 력 충 은 
3 개 의 출력 노 드 를 가 지 도록 구 성 하였다. 그리고 각 
충 에 대하여 67081 5126 와 5660 5126 를 실 험 에 의하 
여 설 정 하 였다. 112 씨 분 류 기 의 각 계 충 에 대한 세 
부 - 구 성 온 - 표 1 과 같다. 


표 1. 음악 장르 분류 시 스 템 의 124 구성 


4. 실험 및 결과 분석 


11 찌 씨 올 이용한 음악 장르 분류 시 스 템 은 펜티엄 
20, \1000\5 환 경 에서 19481 (>++ 로 구 현 하였다. 

그림 15 는 구성된 시간 지연 신 경 망 을 학 습 하는 
모 습 이다. 학 습 률 은 0.05, 모 멤 은 0.5, 목표 에 러 값 
은 0.01, 제한 반 복 회 수 는 30,000 번 으로 지 정 하여 학 
습 하 였다. 


내 미 지 세 13 : 0.40200 

차 메 자 아 이 1300. 3348 

1 더 이레 도 부비: 3.8713604 
. 3903 


게이버 
10000.  6.00000.  1.000000. 


00 배 버 비베 
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그림 15. 70 씨 의 학습 


학 습 된 음악 장르 분류 시 스 템 의 성 능 올 평 가 하기 
위해, 수 집 된 총 '120 곡 의 각 장르별 음악 데이터 중 
학 습 에 사 용 된 데 이 터 와 학 습 에 사 용 되 지 않은 데이 
터 로 구 분 하여 실 험 하였다. 학습 데 이 터 는 각 장르별 
로 10 개 씩 총 80 개 를, 테스트 데 이 터 는 장 르 별 로 5 개 


씩 총 40 개 롤 사 용 하 였다. 이러한 학습 데 이 터 와 테 
스트 데 이 터 는 객관적인 성능 평 가 를 위해 서로 다른 
곡 에서 각각 추 출 하였다. 그림 16 은 학 습 된 71244 
분 류 기로 테 스 트 하는 모 습 이다. 


가기 히 퇴 0 (36176 :  76 다 00 


20760 \^ ㄴ 46 


0.820787, 0.517487, 


그림 16. 음악 장르 분류 시스템 


실험 결과, 학습 데 이 터 를 분 류 하였을 경우, 92.596 
의 정 인 식 률 ( ㅠ 캘 주 ) 을 보였고, 테스트 데 이 터 에 
대해서는 60% 의 정 인 식 률 을 보였다. 표 2 는 실험 결 
과 이다. 전체적으로 학습 데 이 터 의 정 인 식 률 은 92.5% 
로 높은데 비하여, 테스트 데 이 터 의 정 인 식 률 은 60 
로 비교적 낮았다. 


표 2. 실험 결과 


학습 데이터 ㅣ 테스트 데이터 
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0076 와 [7891 [리의 오 인 식 율 이 높 았 는데, 83810 


(0076 는 77098 하 리 로 오 인 식 한 경 우 가 많았고, 
7298 4621 또한 11470 ㅁ 00( 과 1120 (20[6 로 오인 
식 하였다. 이는 11970 (076 와 '1 ㅜ 73884 1468| 이 모두 
8000 800 에 서 파 생 된 옴 악 장 르 로 연 주 하 는 악기 
구 성 과 리 듬 이 거의 유 사 하기 때 문 이 다 . 81065, 1822, 
86&0 의 오 인 식 예도 이와 유사한 경 우 이다. 이러한 
장 르 들은 일 반 인 들 도 분 류 하기 힘든 장 르 들이다. 
그 외의 완전히 다 론 장 르 들 에 서 의 오 인 식 이 유 는 
학 습 에 사 용 된 다른 데 이 터 들 과 리 듬 과 빠 르 기 가 상 
당 히 달 랐 기 때 문 이 었다. 그리고 이러한 템포 차 이 는 
마디 추 출 에도 영 향 을 끼쳐 대표 패 턴 의 생 성 에 서부 
터 오 류 가 발 생 하 게끔 하였다. 따라서 마디 추출 방 
법 을 보 완 하여 각 장 르 의 곡 에서 나타날 수 있는 다 
양한 템 포 를 수 용 할 수 있도록 하고, 이들을 효과적 
으로 반 영 하는 패 턴 들 에 대하여 1108 떠 분 류 기 를 학 
습 한 다면 인 식 률 올 향 상 시킬 수 있을 것이다. 표 3 은 


표 3. 오 인 식 한 옴 악 장르 
학습 데이터 
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시간 지연 신 경 망 을 이용한 음 와 장르 분류 421 
오 인 식 한 데 이 터 들 에 대한 오 인 식 한 음악 장 르 이 다. 
5. 결 론 


본 논 문 에서는 '112 써 씨 을 이용한 음악 장르 분류 
시 스 템 을 제 안 하 였다. 음 악 의 리듬 규 칙 성에 근 거 하 
여 마 디 를 장르 분류 단 위 로 사 용 하였다. 마 디 는 리 
듬 악기 중 가장 주 기 적 이며 뚜 렸 한 음 색 을 가지는 
스네어 드 럼 을 기 준 으로 추 출 하였다. 이러한 마 디 에 
대한 17 특징 벡 터 를 대표 패 턴 으로 학 습 하 여 
772 써 찌 음악 장르 분 류 기를 구 성 하 였다. 

오디오 데 이 터 의 내 용 기반 검 색 에 대한 연 구 가 미 
흡 한 가운데 관심 있는 영역 추출 방 법 과 분류 방법 
에 대한 하 나 의 접근 방 법 을 제 시 하였다 

제안한 시 스 템 은 유사한 장 르 를 분 류 하기 위한 효 
과 적 인 특징 추 출 에 관한 연구, 다양한 리 듬 과 빠르 
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기를 수 용 할 수 있는 마디 추출 방 법 의 보완, 다양한 
템 포 의 곡 들 에 대한 대표 패턴 분류 방 법 에 대한 연 

들을 통하여 성 능 을 개선 할 수 있을 것이다. 더불 
어 곡 중 예 서 의 클라이맥스 추출 방법 개발, 효율적 
인 사용자 질의 및 비교 방 법 의 개발 등 이 향후 연구 
과 제 이다 
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